查看原文
其他

【1041】变量之间到底是单项转化还是双向转化

松哥统计 精鼎统计 2023-03-23
缘起

    我们知道,观察单位的某项特征就是变量,变量根据自身的属性又分为数值变量、等级变量和分类变量,众多统计书上说变量之间是可以转化的,但到底是单向转化,还是双向转化呢?目前存在两个观点,一是只能单向,另一就是可以双向转化。今天我们来看看到底是如何转化的!

精鼎45/46期SPSS统计软件实战训练营

(即将开班)

高级向低级转


单向转化的观点是,变量只能从高级别变量向低级别变量转化,变量级别由高到低依次为数值变量-等级变量-分类变量。依次单向转化的观点就是只能从数值转化为等级,等级转化为分类,或者数值直接转化为分类。


如某人收缩压直接测定值为180mmHg,是数值变量;但按照高血压分级的定义,该人是三级高血压,此时等级变量为(三级高血压、二级高血压和一次高血压);如果按照需呀是否正常,又可以分为正常与不正常,此时就是分类了。


因此,变量从高级向低级转化是没问题的。争议之处是从低级望高级转化。


低级向高级转


比如有个人,知道血压不正常,您是如何知道其是高血压还是低血压,如何知道其具体的血压值呢?貌似这是不可能的,确实按照这个思路是条死路。


但有人说,我们在构建模型的时候,比如将性别带入模型(定义男=1,女=2),那么此时不就是将分类变量转换为数值变量,有低级变为高级了吗?


还比如把高级职称、中级职称和初级职称,定义为1、2、3,不也是同样的道理吗?


貌似这种说法也没有问题,但有一点。此种变换只是为了适应构建模型的需要,变量本身并没有变成高级别。比如说数值变量是有单位的,上述代换的数值是没有单位的,并且也不能支持数学换算。比如男=1,女=2,此时1+2并不等于3。


松哥统计说

变量有三种,级别分高低,高者可变低,此乃真变换,变量属性特征同时变换;低级变高级,实乃伪变换,仅为适应模型构建!


但这种伪变换确实有非常大的价值,尤其在构建回归模型的过程中,能够比教分类变量(变换后需要设置哑变量),等级变量不同水平对因变量Y的影响!


精鼎原创,欢迎转发,未经允许,谢绝转载!



统计思维与统计理论系列[1]

【1040】统计水平自我评估表

【1039】基线分析的3个终极目的

【1038】统计小白的学习路径

【1037】SCI论文中Logistic回归模型“门当户对”原则,松哥心得推荐给您

【1036】被我们忽视的生存分析区间删失数据

【1035】Logistic回归文章的SCI审稿人意见解读

【1034】统计学上的2K效应,你发现了没?

【1033】正态分布的3个基因密码,聆听大自然心跳的代码!

【1032】生存分析K-M法与COX回归结论不一致怎么办?

【1031】异常值的处理只有删除?

【1030】没有比较就没有伤害,让咱们互相伤害吧,教你4大类统计伤害方法

【1029】SCI审稿人让我控制2个单因素无意义的变量?

【1028】量表评价是信度重要还是效度重要?

【1027】Meta分析要解决的首要任务

【1026】文章材料与方法中统计方法如何描述

【1025】聚类分析稳定性判别的经验总结

【1023】“参数检验与非参数检验”哪个更好?

【1022】聚类分析只需这1张图就够了!

【1021】干预前后数据统计分析方法

【1020】听完四个小故事,你就明白主成分分析是啥意思了!

【1019】方差分析P>0.05,两两比较LSD法P<0.05,这可咋整?

【1018】倾向性评分后数据,应该采用配对设计还是成组设计?

【1017】双重差分模型,何方神圣?

【1016】等级与等比,可得分清楚!

【1015】频率与概率,如胶又似漆!

【1014】终于发现不用学习,顿悟统计的方法

【1013】加权最小二乘回归是什么鬼?

【1012】统计世界的4维空间

【1011】平行性检验到底应该啥时候做?

【1010】这篇文章凭啥这样分组呢?

【1009】常用统计分析方法选择图解

【1008】啥!统计也会犯错,还分犯I类和II类错误?

【1007】统计必学的4个核心思想

【1006】别说相关太简单,且听松哥说相关

【1005】统计方法与统计思想谁重要?

【1004】正态分布10种鉴别方法汇总【荐藏】

【1003】连续变量变成等级变量后,原来有意义的变量变得没意义了?

【1002】别人让我出了5道选择题,顺便你也测测!

【1001】SCI论文中的P for trend是什么鬼?为什么高分文章经常采用呢

-------------------------------------------

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存